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fi 要 : [目的 /意义 ] 从 专利 分 类 修订 角度 研究 技术 演化 ,为 技术 演化 研究 提供 新 思路 。[ 方 法 /过 程 ] 首先 根据 IPC 分 类 
表 日 部 2009 -2018 年 的 修订 情况 ,总 结 出 新 增 分 类 、 删 除 分 类 、 类 内 转移 分 类 、 类 间 转 移 分 类 4 种 修订 类 型 。 其 
次 针对 分 类 修订 后 产生 的 过 档 文 献 提 出 基于 Word2vec + TextCNN 模型 的 过 档 文 献 再 分 类 方法 ,使 新 旧版 分 类 表 
通过 再 分 类 专利 产生 衔接 。 最 后 结合 H 部 2009 年 -2018 年 被 修订 分 类 及 再 分 类 专利 进行 技术 演化 初步 探索 。 
[ 结果 /结论 ] 专利 再 分 类 模型 可 有 效 解决 过 档 文 献 问 题 ,为 专利 再 分 类 工作 提供 参考 ,同时 可 衔接 新 旧版 专利 分 
类 表 ; 结 合 IPC 分 类 修订 及 再 分 类 专利 可 分 析 分 类 修订 中 的 主要 技术 演化 方向 ,为 技术 演化 研究 提供 新 视角 。 
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二 技术 演化 是 指 对 一 定时 期 内 技术 发 展 过 程 ,包括 
> 展 历史 .现状 以 及 未 来 趋势 的 描述 ,通过 专利 文 
献 请 量 分 析 .文本 挖掘 、 趋 势 预 测 等 可 实现 技术 演化 描 
述 从 而 掌握 技术 发 展 轨迹 。 现 有 研究 中 基于 专利 分 
析 矿 究 技术 演化 的 方法 通常 可 划分 为 两 大 类 :中 基于 
利 元 数据 的 技术 演化 研究 ,例如 对 专利 数量 申请 地 
申请 人 等 统计 排序 或 对 专利 分 类 共 现 关系 专利 引 
用 关系 进行 分 析 , 这 类 研究 着 眼 于 分 析 专 利 外 部 著录 
项 随时 间 推进 过 程 中 的 趋势 或 关联 关系 ,如 谢 寿 峰 从 
专 而 申请 量 、 申 请 人 等 角度 建立 了 技术 演变 的 研究 框 
架 "; 刘 云 等 从 专利 申请 量 和 增长 率 的 二 维和 矩阵 、 国 
家 /地 区 .机构 等 结合 专利 质量 分 析 全 球 砚 纳米 管 的 技 
术 创 新 特征 中 ;J。Suzuki 等 使 用 IPC 主 分 类 .扩展 分 类 
LAB IPO 特有 分 类 “facet code” 分析 了 技术 演化 罗 
迹 ”。@@ 基 于 专利 内 容 的 技术 演化 研究 , 常 通过 自然 
语言 处 理 \ 文 本 挖掘 等 技术 手段 进行 主题 内 容 和 主题 


利 分 类 作为 元 数据 开展 的 技术 演化 研究 ,也 有 将 专利 
分 类 作为 技术 内 容 开 展 的 技术 演化 研究 。 

将 专利 分 类 作为 元 数据 的 技术 演化 研究 常 从 分 类 
号 的 统计 和 共 现 角度 出 发 ,通过 分 类 数量 频次、 共 现 
关系 网 络 的 特征 等 分 析 技术 现状 和 趋势 。 如 J. Zheng 
等 通过 统计 6 个 行业 专利 的 USPC 号 分 析 中 国 2003 - 
2008 年 的 工业 和 技术 发 展 汪 ;X，Zhou 等 通过 专利 分 
类 号 追踪 技术 发 展 路 径 ” ; S. Jun 通过 挖掘 专利 分 类 
的 关联 规则 判断 技术 趋势 " ; 黄 斌 等 基于 专利 分 类 共 
现 识 别 技术 关联 特征 " ;J K. C. Chen 等 通过 专利 和 
专利 分 类 复合 网 络 研究 日 本 .美国 等 国家 或 地 区 的 大 
BAI He Te AH A; Es J. Kraft 等 使 用 分 类 共 
现 网 络 的 中 心 度 、 结 构 洞 和 中 间 人 方法 识别 技术 关联 
网 络 中 的 核心 技术 ,中介 技术 和 新 兴 技 术 ”-" 。 此 外 
也 多 见 将 专利 分 类 作为 技术 内 容 开展 的 技术 主题 演 
化 。 如 方 曙 等 用 分 类 号 代替 关键 词 ,对 基于 语义 的 分 


强度 的 演化 分 析 。 如 雇 列 法 等 结合 LDA 主题 模型 与 
IPC 分 类 来 分 析 主 题 强度 .主题 内 容 和 技术 主题 强 
度 ” ; 陈 伟 等 结合 LDA 模型 和 HMM 模型 分 析 技 术 主 
题 演化 5 ;J Yoon 等 基于 SAO 语义 结构 分 析 技 术 趋 
$0) SH. Sasaki 等 通过 时 间 序 列 上 的 IPC 共 现 研究 技 
术 融 合 ,识别 技术 机 会 "; 。 以 上 两 类 研究 中 , 既 有 将 专 


类 号 -文档 矩阵 进行 聚 类 ,从 而 研究 技术 演化 ; 吴 
红 等 将 IPC 分 类 作为 技术 语 境 提出 WI-LDA 模型 ,以 
改进 传统 LDA 模型 主题 辨识 性 低 、 可 解释 性 弱 等 问 
BUS ; 雷 滔 , 苗 红 等 以 主 IPC 和 追加 IPC 的 流向 作为 知 
识 流 向 来 研究 技术 跨 领域 关联 度 特征 "等 。 

目前 无 论 将 专利 分 类 作为 元 数据 还 是 技术 内 容 开 
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展 技 术 演 化 研究 ,大 多 直接 将 专利 分 类 体系 作为 既成 
知识 体系 使 用 ,很 少 考虑 到 专利 分 类 体系 也 随 技术 演 
化 而 被 修订 ,因此 从 专利 分 类 修订 角度 探索 技术 演化 
的 研究 成 果 也 较 少 。F，Lafond 等 从 专利 分 类 数量 E 
利 分 类 规模 .重新 分 类 3 个 方面 研究 USPC 的 长 期 动 
态 ""1; 兰 德 公司 根据 新 增 专利 分 类 的 时 间 来 确定 专利 
权 人 在 技术 领域 中 的 领导 型 或 跟随 型 地 位 5 ; CC. 
Wang 等 基于 美国 专利 重新 分 类 的 5 种 类 型 来 研究 技 
RRL ; 王 文 晶 讨论 了 新 能 源 汽车 产业 关键 技术 与 
专利 分 类 修订 的 关联 ; 牛 力 等 从 空调 领域 的 IPC 修 
订 描 述 了 技术 变化 ”3 ,这 是 少 有 的 从 专利 分 类 修订 的 
角度 关注 技术 演化 的 研究 。 

本 文 从 IPC 分 类 修订 出 发 ,提出 基于 IPC 分 类 修 
庄 的 技术 演化 研究 这 一 命题 ,并 设计 专利 再 分 类 模型 
实现 专利 自动 再 分 类 ,用 再 分 类 专利 联系 新 旧版 IPC 
分 弱 体系 , 意 在 结合 被 修订 分 类 及 再 分 类 专利 描述 技 
壬 化 情况 ,通过 对 比 新 旧版 分 类 表 的 修订 结果 来 表 
示 据 术 演化 结果 ,用 被 修订 分 类 的 专利 由 旧版 分 类 转 
移 到 新 版 分 类 的 过 程 亦 即 过 档 文献 的 再 分 类 过 程 来 表 
ABORT ALIFE. KIOM IPC 分 类 修订 和 专利 再 分 
奖 守 现 技术 演化 的 研究 一 方面 可 以 丰富 技术 演化 研究 
六 导体 系 ,为 技术 演化 研究 提供 新 视角 , 另 一 方面 本 文 
提出 的 专利 再 分 类 方法 为 基于 IPC 分 类 实现 技术 演化 
研究 提供 了 实现 方法 和 路 径 ,可 为 世界 知识 产权 组 织 
的 乔 利 再 分 类 工作 提供 思路 ,从 而 完善 IPC 分 类 作为 
专 币 文献 检索 和 管理 工具 的 职能 。 


APC 分 类 及 其 修订 


IPC 分 类 是 根据 1971 年 签订 的 斯 特 拉 斯 堡 协定 编 
制 ” ,世界 知识 产权 组 织 (WIPO ) 认为 “为 保持 IPC 分 
类 作为 专利 文献 检索 和 管理 的 有 效 工 具 , 它 必 须 是 动 
态 的 ,需要 不 断 的 修订 ”” ,目前 IPC 分 类 已 更 新 至 第 
八 版 ,2006 年 开始 使 用 的 第 八 版 迄今 也 已 修订 十 余 
次 ,2009 开始 WIPO 固定 在 每 年 1 月 1 日 公布 新 版 分 
类 表 。IPC 分 类 的 历史 版 本 及 各 版 的 有 效 时 间 见 表 1。 

IPC 分 类 的 修订 内 容 包括 分 类 号 、 分 类 标题 ( 官 
方 注解 ) 索引、 附注 和 人 参见。 其 中 分 类 号 和 分 类 标 
题 是 决定 技术 范围 的 信息 ;索引 、 附 注 和 参见 是 使 用 
IPC 分 类 表 的 指引 性 信息 。 但 索引 、 附 注 和 参见 的 修 
订 不 涉及 技术 变化 ,因此 本 文 只 关注 分 类 号 和 分 类 
标题 的 修订 ,基于 此 总 结 了 4 种 IPC 分 类 修订 类 型 : 
新 增 分 类 、 删 除 分 类 、 类 内 转移 分 类 和 类 间 转 移 分 
类 。 


表 1 各 版 耻 C 分 类 表 及 有 效 时 间 


IPC 分 类 表 版 本 让 用 时 间 停 用 时 间 更 新 周期 
第 一 版 1968.9.1 1974.6.30 5 年 
第 二 版 1974.7.1 1979. 12.31 5 年 
第 三 版 1980.1.1 1984. 12.31 5 年 
第 四 版 1985.1.1 1989. 12.31 5 年 
第 五 版 1990.1.1 1994. 12.31 5 年 
第 六 版 1995.1.1 1999. 12.31 5 年 
第 七 版 2000.1.1 2005. 12. 31 5 年 
第 八 版 2006.1.1 至 今 1 年 


注 :资料 来 源 于 WIPO 
(1) 新 增 分 类 是 指 直 接 对 原 有 分 类 号 进行 细 分 ， 
由 于 技术 发 展 , 原 有 分 类 表示 的 技术 主题 能 以 更 加 精 
细 的 方式 进行 细 分 时 ,就 需要 新 增 分 类 ,如 图 1 所 示 
HO1L33/00 大 组 的 修订 即 为 新 增 分 类 。 


HO1L33/38 


图 1 H01L33/00 大 组 的 新 增 模式 示意 


(2) 删 除 分 类 是 指 在 新 版 分 类 表 中 删除 旧版 分 类 
号 ,通常 会 将 被 删除 分 类 迁移 至 分 类 表 中 其 他 位 置 。 
而 分 类 的 迁移 结果 又 表现 为 两 种 情况 :一 是 分 类 号 直 
接 迁 移 至 其 他 分 类 ,即将 该 分 类 与 其 他 分 类 合并 ;二 是 
分 类 号 改变 ,但 包含 的 技术 主题 并 未 改变 。 

(3) 类 内 转移 分 类 。 类 内 转移 分 类 是 指 分 类 号 在 
类 内 进行 迁移 ,判断 标准 是 原 分 类 号 被 删除 ,将 该 技术 
主题 转移 至 新 分 类 号 ,并 且 新 分 类 号 与 原 分 类 号 的 上 
位 类 相同 ,如 图 2 所 示 HO4H 小 类 修订 即 为 类 内 转移 。 

(4) 类 间 转 移 分 类 。 类 间 转 移 分 类 是 指 分 类 号 在 
类 间 迁 移 , 判 断 标准 是 原 分 类 号 被 删除 并 转移 至 新 分 
类 ,新 分 类 与 原 分 类 的 上 位 类 不 同 ,如 图 3 所 示 HO2S 
小 类 的 修订 即 为 类 间 转 移 。 

从 世界 知识 产权 组 织 目前 的 工作 流程 和 机 制 来 
看 ,专利 分 类 修订 后 并 不 对 已 分 类 专利 进行 重新 分 类 ， 
因此 产生 “过 档 文 献 ”, 即 由 于 IPC 分 类 被 修订 ,已 分 类 
专利 并 不 随 分 类 修订 而 调整 分 类 号 ,因此 当 使 用 新 版 
分 类 号 进行 专利 检索 时 ,使 用 旧 分 类 号 的 专利 文献 无 
法 作为 检索 结果 反馈 给 用 户 , 这 部 分 未 随 专利 分 类 修 
订 而 调整 分 类 号 的 专利 文献 就 成 为 过 档 文 献 。 过 档 文 


141 


AELE EZ 


第 65 卷 第 15 期 2021 #8 A 


ChinaXiv 合 作 期 刊 


修订 前 


修订 后 


HO04H1/02 转 入 HO4H20/76 ”HO4H1/10 转 入 HO4H20/82 HO04H7/00 转 入 HO4H60/40 
HO04H1/04 转 入 HO04H20/77  HO4H1/124&.H04H20/83 H04H7/02 转 入 H04H60/05 
H04H1/06 转 入 HO4H20/80 H04H1/144&)H04H20/84 HO04H7/04 转 入 HO4H20/14 


H04H1V08 转 入 H04H20/81 ”H04H3/00 转 入 HO4H20/67 


<> 


0528v1 


HO1L31/058 


mai 


3 HOS 小 类 的 类 间 转 移 模式 示意 


得 基于 IPC 分 类 修订 研究 技术 演化 时 存在 不 同 分 
本 之 间 的 不 连续 问题 , 即 旧 版 分 类 和 新 版 分 类 在 
前 后 无 法 衔接 ,因此 仅 依靠 修订 前 后 两 个 版 本 分 
只 能 观察 技术 演化 结果 但 无 法 描述 技术 演化 过 
鉴于 此 ,本 文 设 计 了 基于 Word2vec + TextCNN $ 
型 的 过 档 专 利文 献 再 分 类 方法 ,通过 对 过 档 文献 再 分 
类 建立 新 旧版 专利 分 类 间 的 映射 关系 ,并 利用 再 分 类 
专利 来 描述 分 类 修订 后 的 专利 流向 信息 ,从 而 描述 技 
术 演 化 过 程 。 


2 数据 来 源 与 研究 方法 


2.1 数据 来 源 

由 上 述 介绍 可 知 第 八 版 PC 分 类 表 是 目前 最 新 版 
分 类 表 , 并 且 自 2009 年 开始 统一 在 每 年 1 月 1 日 更 新 
新 版 本 ,因此 本 文选 择 2009 年 -2018 年 作为 研究 的 时 
间 窗 。 男 外 ,比较 IPC 分 类 表 中 A - H8 个 部 在 2009 年 
-2018 年 的 修订 次 数 ,H 部 共 修 订 20 次 ,是 修订 次 数 
最 多 的 部 ,表明 H 部 (电学 ) 领 域 的 技术 创新 和 发 展 速 
度 较 快 ,使 用 H 部 数据 做 案例 研究 更 容易 得 出 技术 演 
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2 HOA 小 类 修订 的 类 内 转移 模式 示意 


化 的 特征 。 因 此 本 文选 择 第 八 版 IPC 分 类 表 H 部 被 修 
订 分 类 作为 切入 点 ,以 2009 年 -2018 年 被 修订 分 类 作 
为 检索 限制 条 件 , 以 该 时 间 段 互 部 被 修订 分 类 的 公开 
专利 作为 数据 源 进 行 研 究 。 

2.2 专利 再 分 类 模型 

专利 再 分 类 实际 是 对 过 档 文献 进行 文本 自动 分 
类 ,本 文 提出 基于 Word2vec + TextCNN 模型 的 专利 再 
分 类 方法 ,通过 机 器 学 习 模型 解决 专利 分 类 修订 后 的 
过 档 文 献 问题 。 

Word2vec 是 2013 年 Google 开源 的 一 款 词 向 量 
(word embedding ) 计算 工具 ,是 词 租 人 (word embed- 
ding) 的 一 种 ,也 是 一 种 无 监督 的 学 习 模 型 ,能 将 词语 
嵌入 到 一 个 数学 空间 ” 。 简 单 地 说 ,Word2vec 可 以 在 
给 定 的 语料库 上 进行 训练 ,得 到 预 训练 模型 ,使 用 该 模 
型 能 输出 所 有 出 现在 上 述 语料库 中 单词 的 向 量 表示 ， 
基于 这 个 向 量 可 以 计算 词 与 词 之 间 的 关系 ,如 词 与 词 
之 间 的 相似 性 .语义 关联 关系 等 。 

TextCNN 模型 是 2014 £ Hh Y. Kim 在 Convolution- 
al Neural Networks for Sentence Classification 一 文中 提 
出 ,该 算法 利用 卷 积 神经 网 络 CNN 进行 文本 分 类 任 
务 ,利用 多 个 不 同 size 的 kernel 来 提取 句子 中 的 关键 

言 息 ,从 而 能 够 更 好 地 捕捉 局 部 相关 性 。 

本 文 提出 基于 Word2vec + TextCNN 模型 的 专利 再 
分 类 方法 ,主要 包括 数据 检索 .数据 获取 、 数 据 预 处 理 、 
文本 分 词 Word2vec 模型 训练 .专利 文本 向 量化 Tex- 
tCNN 模型 训练 专利 再 分 类 等 过 程 ,完整 的 技术 实现 
流程 如 图 4 所 示 : 
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提取 中 文 标题 -中 文摘 要 


数据 检索 和 获取 


数据 集 划 分 


训练 数据 


中 文 标 题 -中 文摘 要 - 主 


去 除 停 用 词 


预 训 练 word2vec 模 型 


保存 已 训练 word2vec 模 型 


202304.00528v1 


SZO SABER ALB, LL WIPO 公布 的 修订 分 类 
WTP RAE, HERE Incopat 专利 数据 库 作 为 数据 来 
源 Seopat 专利 数据 库 具备 自动 翻译 功能 ,可 将 外 文 专 

泽 为 中 文 ,便于 后 续 中 文 专利 文本 处 理 ,因此 在 
Incopat 专利 数据 库 中 检索 并 获取 专利 文献 集合 。 

(2) 中 文 分 词 并 去 除 停 用 词 。 选 择 jieba 分 词 工具 
进行 中 文 分 词 ,去 除 如 标点 符号 ,特殊 字符 .语气 词 等 
停 用 词 , 将 去 除 停 用 词 后 的 中 文 标题 和 摘要 作为 
Word2vec 模型 的 训练 语 料 集 。 

(3) 训 练 Word2vec 模型 。 本 文 借用 python 中 NLP 
包 gensim 训练 Word2 vec ,模型 输入 语 料 为 (2) 中 已 分 
词 的 专利 标题 和 摘要 ,保存 训练 后 的 Word2vec 模型 。 

(4) 数 据 集 划分 。 以 IPC 分 类 修订 时 间 为 界限 , 修 
订 时 间 之 前 公开 的 专利 为 过 档 专利 文献 ,也 是 再 分 类 
的 任务 数据 集 ; 修 订 时 间 点 之 后 公开 的 专利 为 训练 数 
据 集 。 

(5) 训 练 数据 和 任务 数据 分 词 去 除 停 用 词 。 分 
别 对 训练 数据 和 任务 数据 进行 分 词 去 除 停 用 词 操作 。 

(6) 文 本 向 量化 。 调 用 (3 ) 中 已 训练 的 Word2vec 


IPC 分 类 号 


文本 向 量化 


ae 
文本 向 量化 
一 


TextCNN 模 型 保存 


RRAN ee 


去 除 停 用 词 


训练 数据 label- 


text_context 格 式 


任务 数据 公开 号 - 
text_context 格 式 


专利 再 分 类 


4 ”基于 Word2vec + TextCNN 模型 的 过 档 文 献 再 分 类 技术 实现 流程 


模型 ,计算 训练 数据 和 任务 数据 的 专利 文本 向 量 ,作为 
TextCNN 模型 的 训练 语 料 。 

(7)TextCNN 模型 训练 。 借 助 tensorflow 工具 构建 
TextCNN 模型 并 将 (6) 中 已 分 词 的 训练 语 料 作为 模型 
输入 ,训练 专利 再 分 类 模型 。 在 训练 过 程 中 随机 选择 
80% 的 训练 数据 作为 生成 模型 参数 的 训练 集 , 另 外 
20% 的 训练 数据 作为 模型 效果 的 测试 集 , 通 过 测试 集 
数据 的 分 类 结果 计算 模型 准确 率 , 选 择 此 种 方式 计算 
模型 准确 率 的 原因 在 于 目前 世界 知识 产权 组 织 未 对 过 
档 文献 进行 再 分 类 ,所 以 无 法 获取 到 专业 分 类 员 标 注 
数据 (分 类 员 手 工 再 分 类 专利 数据 ) 作为 模型 性 能 验 
证 数据 集 。 

(8) 使 用 已 训练 再 分 类 模型 对 (4) 中 的 任务 数据 集 
(过 档 文 献 ) 进 行 再 分 类 ,并 保存 再 分 类 结果 , 见 表 2 示例 。 
2.3 模型 性 能 评价 

再 分 类 模型 性 能 评价 可 借鉴 常用 机 器 学 习 模型 评 
价 指标 ,如 准确 率 和 损失 函数 。 准 确 率 ( Accuracy ) 表 
示 样 本 被 正确 分 类 的 比例 ,直接 用 来 衡量 文本 分 类 模 
型 的 效果 ,通常 准确 率 越 高 ,说 明 模型 分 类 效果 越 好 。 
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表 2 过 档 文献 再 分 类 结果 示例 


公开 号 修订 前 修订 后 公开 号 修订 前 修订 后 
US10529868B2 HO2N6/00 H02840/34 AP3824A HO2N6/00 H02840/30 
US10529871 B2 HO2N6/00 H02840/22 BRPI1314051A2 HO2N6/00 H02820/00 
BRPI1202097 A2 HO2N6/00 HO2S20/00 IN8735DELNP2011A HO2N6/00 HO2S40/22 
US10361325B2 HO2N6/00 H02840/36 W02016057341 Al HO2N6/00 HO2S40/38 
US20180254368A9 HO1L31/058 H02850/00 W02015157328A3 HO1L31/058 H02S10/30 

: EERS 
准确 率 ( Accuracy , acc) = 分 类 正确 的 样本 数量 
总 样本 数量 


损失 函数 (Loss) 用 来 计算 分 类 后 预测 值 与 真实 值 
之 间 的 距离 大 小 , 当 预 测 值 与 真实 值 的 差距 越 大 时 , 损 
失 函 数 Loss 越 大 , 则 需要 优化 模型 减 小 Loss ;损失 函数 
越 小 时 ,说 明 模型 分 类 效果 越 好 。 本 文中 使 用 的 是 12 
范 数 损失 函数 ,也 被 称 为 最 小 平方 误差 损失 函数 
(ISE) ,通过 计算 预测 值 与 真实 值 间 差 值 平方 和 的 最 
人 尖 罩 获得 ,公式 如 下 ,其 中 y ,> 分 别 表示 真实 值 和 预 
IMA. 
© 


= Levy ay 

如 图 5 所 示 , 模 轴 表 示 模型 训练 步 数 , 纵 轴 表示 模 
型 洲 确 率 , 当 训练 步 数 逐 浙 增 加 时 ,模型 准确 率 也 不 断 
增加 , 当 训练 到 1 200 步 左右 时 ,模型 准确 率 接近 到 
80Q99 ,其 中 最 高 准确 率 达到 82% 。 与 目前 专利 文本 自 
彰 训 类 研究 相 比 ,准确 率 较 高 ,说 明 本 文 提出 的 专利 再 
分 美 模型 能 够 有 效 进行 过 档 文献 再 分 类 。 如 图 6 所 
载 答 轴 表 示 模 型 的 训练 步 数 , 纵 轴 为 损失 函数 值 。 随 
aiso ,模型 损失 函数 值 不 断 降低 , 当 模 型 训 
练 至 1 000 步 后 ,损失 函数 曲线 趋 于 收敛 ,损失 函数 值 
人 
即 模型 已 能 达到 最 优 准 确 率 。 综 合 模型 准确 率 和 损失 
函数 曲线 来 看 本 文中 训练 的 再 分 类 模型 已 经 取得 较 高 
的 准确 率 ,即使 用 该 模型 进行 过 档 文献 再 分 类 能 取得 
较 好 效果 ,分 类 准确 率 能 达到 80% 左右 ,为 后 续 使 用 
再 分 类 专利 进行 技术 演化 分 析 提供 了 数据 质量 保障 。 


3 IPC 分 类 修订 中 的 技术 演化 分 析 一 一 
以 H 部 为 例 


3.1 申请 趋势 分 析 

首先 分 析 H 部 专利 公开 趋势 ,如 图 7 左 图 所 示 为 
2009 年 -2018 年 了 部 已 修订 和 未 修订 分 类 的 专利 公 
开 趋 势 。 从 图 7 来 看 ,H 部 分 类 的 专利 公开 量 逐 年 上 
升 ;H 部 未 修订 分 类 的 专利 公开 量 在 2011 年 -2014 年 
稍 有 增长 ;修订 分 类 的 专利 公开 量 在 2009 年 -2014 年 


准确 率 (ACC) 


0 200 400 600 800 1000 1200 1400 
训练 步 数 (TRAIN-STEP ) 


图 5 再 分 类 模型 的 准确 率 曲线 
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图 6 再 分 类 模型 的 损失 函数 曲线 


平稳 增长 ,但 2014 年 后 快速 增长 ,并 且 修订 分 类 的 专 
利 公开 趋势 线 与 H 部 专利 公开 趋势 线 走势 大 致 相同 ， 
说 明 H 部 专利 公开 量变 化 受 修订 分 类 专利 公开 量变 
化 的 影响 较 大 。 从 H 部 修订 与 未 修订 分 类 的 专利 公 
开 量 占 比 来 看 ,如 图 7 右 图 所 示 ,2014 年 之 前 修订 分 类 
与 未 修订 分 类 的 专利 公开 量 在 H 部 的 全 部 专利 公开 中 
占 比 相对 稳定 ,未 修订 分 类 的 专利 公开 量 稳定 在 76% 左 
右 ,2014 年 后 未 修订 分 类 占 H 部 专利 分 类 公开 量 的 比例 
逐年 下 降 , 到 2018 年 已 下 降 到 约 60% ,而 修订 分 类 的 专 
利 公开 量 占 比 则 从 2009 年 的 24% 上涨 到 2018 年 的 
40% ,也 可 见 修订 分 类 所 表示 技术 发 展 迅速 。 
3.2 新 增 分 类 的 技术 演化 分 析 

新 增 分 类 可 以 表示 技术 领域 新 发 展 , 当 新 技术 出 
现时 , 原 有 技术 分 类 无 法 涵盖 新 技术 ,因此 需要 增加 新 
分 类 来 表示 技术 新 进展 。 
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7 ”专利 公开 趋势 ( 左 图 ) 和 专利 公开 量 占 比 ( 右 图 ) 


如 表 3 所 示 , 在 2009 年 -2018 年 10 年 时 间 窗 内 ， 

HH 部 的 新 增 分 类 集中 在 HO1( 基 本 电气 元 件 ) .H02( 发 
< 喜 电 或 配 电 ) .H04( 电 通信 技术 )3 个 领域 ,涉及 到 
HOIF( 磁 体 ;电感 ;变压器 ;磁性 材料 选择 ) .HO1G( 电 
窜 回 整流器、 检 波 器、 开关 ,光敏 或 热 敏 器 件 等 )、 
H6 避 (半导体 器 件 ) HOLM (化 学 能 转化 为 电能 的 装 
置 sz 电池 组 ) .HOIR( 导电 连接 ;相互 绝缘 电 连 接 元 
SS 集 电器 等 ) .HO1Q (天线) .HO2K( 电 机 ) .HO2P( 电 


站 希 、 发 电机 或 机 电 变换 器 的 控制 或 调节 ;控制 变 压 
器 电抗 器 或 扼 流 圈 ) .HO3K (脉冲 技术 ) HO4B ( 传 
N #3 2009 + -2018 年 H 部 新 增 分 类 及 其 专利 公开 量 


ae 


输 ) HOLL 数字 信息 的 传输 ,如 电报 通信 )、HO4N( 
像 通 信 , 如 电视 )。 从 表 3 数据 可 知 ,2009 年 -2018 年 
H 部 新 增 分 类 中 HOIL( 半 导体 器 件 ) 和 HO1M( 化 学 能 
转化 为 电能 的 装置 ,如 电池 组 ) 的 专利 公开 量 占 比 最 
大 ,分 别 为 24.78% 和 24. 83% ,说 明 该 领域 出 现 了 较 
多 技术 创新 ;其 次 是 HO4L( 数字 信 息 的 传输 ,如 电报 通 
信 ) 和 HO4N( 图 像 通信 ,如 电视 ) ,分 别 占 比 16. 49% 和 
17.36% ,其 余 小 类 所 代表 技术 的 新 增 分 类 专利 公开 量 
都 在 5% 及 以 下 。 


== 大 类 领域 小 类 专利 公开 量 ( 占 比 /% ) 小 类 描述 
i 基本 电气 元 件 HOLF 2 731(0.29) 磁体 ;电感 ;变压器 ;磁性 材料 选择 
© HOIG 33 149(3.51) BARE ETE AS RTE A FPS ABBAS AE E 
c HOIL 234 284(24.78) 半导体 器 件 
HOIM 234 794 (24. 83) 化 学 能 转化 为 电能 的 装置 ,如 电池 组 
© HOIR 13 785(1.46) 导电 连接 ;相互 绝缘 电 连 接 元 件 ; 集 电器 等 
HO1Q 14 460(1.53) KR 
H02 发 电 、 变 电 或 配 电 HO2K 11 341(1.2) 电机 
HO2P 18 973(2.01) 电动 机 发 电机 或 机 电 变换 器 的 控制 或 调节 ;控制 变压器 .电抗 器 或 扼 流 圈 
H03 基本 电子 电路 HO3K 661(0.07) 永 冲 技术 
H04 电 通 信和 技术 HO4B 61 260(6. 48) 传输 
HO4L 155 976( 16.49) 数字 信息 的 传输 ,如 电报 通信 
HO4N 164 197(17. 36) 图 像 通信 ,如 电视 


合计 

注 : 表 中 百分比 为 四 舍 五 人 后 的 数据 
3.3 删除 分 类 的 技术 演化 分 析 

在 技术 发 展 过 程 中 , 既 有 新 技术 的 产生 也 有 老 旧 
技术 的 淘汰 和 消亡 , 当 旧 分 类 方式 不 再 适用 于 新 技术 
发 展 时 ,会 将 旧 分 类 从 分 类 表 中 删除 ,因此 删除 分 类 可 
以 表示 被 淘汰 或 消亡 的 技术 。 

如 表 4 所 示 ,2009 年 -2018 年 间 H 部 删除 的 分 类 


945 611(100) 


主要 涉及 HO1( 基本 电气 元 件 ) 、HO2 (发 电 、 变 电 或 配 
E) .HO03( 基 本 电子 电路 ) `H04( 电 通信 技术 )4 个 技术 
领域 ,包括 HO1G( 电 容器 ;整流 絮 、 检 波 器 开关、 光敏 
BNA Baie PFS) .HO1H( 电 开关 、 继 电器、 选择 器、 紧急 
保护 装置 ) .HO1J( 放电 管 或 放电 灯 ) .HO1L( 半导体 器 
件 ) .HO1M( 化 学 能 转化 为 电能 的 装置 ,如 电池 组 )、 
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HO1Q( 天 线 ) .HO1R( 导电 连接 ;相互 绝缘 电 连 接 元 件 ; 
集 电 器 等 ) .HO2K( 电 机 ) .HO2N( 其 他 类 目 不 包 含 的 电 
BL) 、HO3F( 放 大 器 )、H04B( 传输 ) .H04J( 多 路 复 用 通 
信 ) 、HO4L( 数字 信息 的 传输 ,如 电报 通信 )、HO4N( 图 
像 通信 ,如 电视 )、H04Q (选择 )、H04W (无 线 通 信和 网 

络 )。 其 中 HO4N( 图 像 通信 ,如 电视 )、H04W (无 线 通 


信和 网 络 ) HOLL 数字 信 息 的 传输 ,如 电报 通信 ) 分 别 占 
比 26.11% .25.64% 21.38% 是 占 比较 大 的 几 个 类 ,说 
明 这 个 儿 个 领域 被 淘汰 或 消亡 的 技术 较 多 ,其 他 小 类 
PER HO1L( 半导体 器 件 ) 的 专利 公开 量 占 比 6% ,剩余 
小 类 的 专利 占 比 尼 在 5% 以 下 。 


表 4 2009 年 -2018 年 删除 分 类 及 其 专利 公开 量 


大 类 领域 小 类 专利 公开 量 ( 占 比 /% ) 小 类 描述 
H01 基本 电气 元 件 HO1C 2 523(0.7) 电容 器 ;整流 器 、 检 波 器 、 开 关 、 光 敏 或 热 敏 器 件 等 
HO1H 4(0.0) 电 开 关 继电器 .选择 器 、 紧 急 保 护 装 置 
HO1J 1 817(0.5) 放电 管 或 放电 灯 
HOIL 21 726(6) 半导体 器 件 
HOIM 11 870(3.28) 化 学 能 转化 为 电能 的 装置 ,如 电池 组 
HO1Q 2 136(0.59) 天 线 
HOIR 10 552(2.91) 导电 连接 ;相互 绝缘 电 连 接 元 件 ; 集 电器 等 
变 电 或 配 电 HO2K 798(0.22) 电机 
HO2N 9 944(2.75) 其 他 类 目 不 包 含 的 电机 
电子 电路 HO3F 33 (0.01) 放大 器 
“HO4 电 通信 技术 H04B 16 348 (4.51) 传输 
HO4J 1 130(0.31) 多 路 复 用 通信 
HO4L 77 421(21. 38) 数字 信息 的 传输 ,如 电报 通信 
HO4N 94 579(26.11) 图 像 通 信 , 如 电视 
H04Q 18 428 (5.09) 选择 
HO4W 92 865(25. 64) 无 线 通信 网 络 


362 174(100) 


: 表 中 百分比 为 四 舍 五 人 后 的 数据 


3. E 类 内 转移 分 类 的 技术 演化 分 析 
£2009 年 -2018 年 H 部 类 内 转移 分 类 主要 涉及 
HOTU 基本 电器 元 件 ) 和 H04( 电 通信 技术 ) 中 的 分 类 ， 
包括 2011 年 修订 的 HO1R12/00 大 组 (用 于 印刷 电路 、 
扁平 或 带 状 电缆 的 导电 连接 ) 和 HO1R24/00 大 组 ( 双 
部 件 连接 的 整体 结构 的 导电 连接 ) ;2012 年 修订 的 
HO1J11/00 大 组 (具有 交流 引发 放电 的 充气 放电 管 , 例 
如 AC-PDP) 以 及 2018 年 修订 的 HO4N13/00 大 组 ( 立 
体 视频 系统 ;多 视点 视频 系统 ;其 零 部 件 ) 。 
HO1R12/00 大 组 ( 双 部 件 连 接 的 整体 结构 的 导电 
连接 ) 的 修订 和 技术 演化 如 图 8 和 图 9 所 示 , HO1R12/ 
00 的 修订 是 对 其 下 位 小 组 进行 调整 ,增加 了 更 细致 的 
技术 分 支 。 图 9 中 左 侧 表示 修订 前 技术 分 类 及 专利 
量 , 右 侧 表示 修订 后 技术 分 类 和 专利 量 , 中 间 连 线 表示 
通过 再 分 类 使 新 旧版 分 类 产生 的 联系 (下 同 ) ,可 知 
HO1R12Z71( 用 于 刚性 印刷 电路 或 类 似 结构 的 耦合 装 
置 ) 是 分 类 修订 后 的 主要 技术 演化 方向 , 约 占 HO1R12/ 


in| 


00 大 组 2009 年 -2010 年 专利 公开 的 59.61% ;其 次 为 
HO1R12/70( #842 & ) , 约 占 比 25.9% 。 

HO1R24/00 大 组 ( 双 部 件 连接 的 整体 结构 的 导电 
连接 ) 的 修订 是 将 旧版 分 类 中 的 细 分 组 全 部 删除 ,重新 
划分 了 新 的 细 分 组 ,修订 前 后 的 技术 结构 如 图 10 所 
示 , 从 图 11 中 技术 演化 情况 可 知 HO1R24/38( 有 同心 
或 同 轴 布 置 的 接触 件 ) .HOR24/00( 双 部 件 连接 的 整体 
结构 的 导电 连接 ) 是 分 类 修订 后 的 主要 技术 演化 方向 ， 
专利 占 比 约 27.37% 和 25.33% 。 

HO1J11/00 大 组 (立体 视频 系统 ;多 视点 视频 系 
统 ; 其 零 部 件 ) 修 订 前 后 的 技术 结构 和 技术 演化 如 图 
12 和 图 13 所 示 。2012 年 版 IPC 分 类 将 HO1J11/02 和 
HO1J11/04 两 个 小 组 转移 到 HO1J11/10 - HO1J11/54 小 
组 ,其 中 HOJ11/22( 充 气 放电 管 电极 ,例如 特殊 形状 、 材 
料 或 结构 ) 和 HOJ11/46( 有 液 池 阴极 的 放电 管 在 结构 上 
与 管子 相连 的 一 个 或 一 个 以 上 的 电路 零 部 件 ) 是 主要 的 
技术 演化 方向 ,专利 占 比 分 别 约 53.34% 和 17.72% 。 
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图 8 HO01R12/00 大 组 修订 前 ( 左 ) 和 修订 后 
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(E) 技术 结构 对 比 


HO1R12 技 术 演 化 图 
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chinaXiv 
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图 9 HO1R12/00 大 组 的 技术 演化 


10 HO01R24/00 大 组 修订 前 ( 左 ) 和 修订 后 


HO4N13/00 大 组 (立体 视频 系统 ;多 视点 视频 系统 ; 
零 部 件 ) 修 订 前 后 的 技术 结构 和 技术 演化 如 图 14 和 
图 15 所 示 。2018 年 版 IPC 分 类 表 将 HO4N13/02 和 
HO4N13/04 重新 分 类 到 HO4N13/10 - HO4N13/198 小 组 ， 


( 右 ) 技术 结构 对 比 


技术 演化 结果 显示 HO4N13/30 (图 像 重 现 装置 )、 
H04N13/20( 图 像 信 号 发 生 器 ) .HO4N13/10( 立 体 或 者 多 
视点 图 像 信号 的 处 理 ,记录 或 传输 ) 是 主要 的 技术 演化 
方向 ,专利 占 比 分 别 约 为 25.92% 13.03% 和 10.13% 。 
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HO1R24 技 术 演 化 图 


HO1R24/02 


202304.00528v1 


chinaXiv 


HO111/02 


一 HOHNIV04 


| HO1R24/38 


HO1R24/40 


= HOIR24/42 
mm HOIR24/44 


= oy 
二 HR) 


HO1R24/00 


— HIR84/83 

HO1R24/60 

mes HOIR24/30 

一 HB Ho1r24/s8 


HOIR24/20 
= HOIR24/62 


12 HO01J11/00 大 组 修订 前 ( 左 ) 和 修订 后 ( 右 ) 技 术 结 构 对 比 


H01J11 技 术 演 化 图 


HOUIV22 


13 HO1J11/00 大 组 的 技术 演化 


3.5 ”类 间 转 移 分 类 的 技术 演化 分 析 

2009 年 -2018 年 H 部 类 间 转 移 分 类 主要 涉及 
H02( 发 电 、 变 电 或 配 电 ) 和 H04( 电 通信 技术 ) 中 的 分 
类 ,包括 2009 年 修订 的 HO4W (无 线 通 信和 网 络 ) ;2011 
年 修订 的 HO4N21/00( 可 选 的 内 容 分 发 ,例如 交互 式 电 


视 , 或 视频 点 播 ) ;2014 年 修订 的 HO2S (由 红外 线 辐 
射 、 可 见 光 或 紫外 光 转 换 产 生 电 能 ,如 使 用 光伏 (PV) 
模块 )。HO04W 小 类 是 2009 年 将 HO4Q7/00 大 组 向 
HO4W 小 类 的 转移 ,修订 前 后 的 技术 结构 和 技术 演化 
如 图 16 和 图 17 所 示 , 其 中 HO04W4/00( 专门 适用 于 无 
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线 通信 网 络 的 业务 ;其 设施 ) .HO04W4/02( 利用 位 置信 | 务 , 例 如 ,多 媒体 广播 组 播 业务 [MBMS] ;到 用 户 组 的 
息 的 无 线 通 信和 网 络 业 务 )、HO4W4/12 (消息 传送 ; 邮 | 业务 ; 单 向 选 呼 业务 ) 等 是 主要 的 技术 演化 方向 ,专利 
箱 ; 通 告 ) .HO4W4/16( 与 通信 相关 的 补充 业务 ,例如 ， 占 比 分 别 约 为 48. 16% 、10. 44% 、10. 54% 、7. 47%、 
呼叫 转移 或 呼叫 保持 )、H04W4/06 (广播 选择 分 发 业 | 6.65% 。 
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15 HO4N13/00 大 组 的 技术 演化 


HO4N21/00 大 组 的 修订 是 将 HO4N7/58、HO4N7/ 
60 和 HO4N7/62 转移 到 HO4N21/00 大 组 ,修订 前 后 技 
术 结 构 和 技术 演化 如 图 18 和 图 19 所 示 。 其 中 
HO04N21/43( 个 人 计算 机 内 容 接 收 或 内 容 交 互 )、 
HO4N21/242 ( 同步 进程 ,例如 程序 时 钟 调用 的 处 理 ) 是 
主要 的 技术 演化 方向 ,分 别 占 比 13. 12% 和 10.0%。 

HO2S 小 类 的 修订 是 将 HO2N6/00 和 HO1L31/045 


和 HOLL31/058 三 个 小 组 合并 并 转移 到 H02S 小 类 , 修 
订 前 后 的 技术 结构 和 技术 演化 如 图 20 和 图 21 所 示 。 
其 中 HO2S20/32( 专 门 用 于 太阳 能 跟踪 的 光伏 模块 支 
撑 结 构 )、H02S40/22 ( 光伏 模块 的 反光 或 集 光 的 设 
备 ) .HO02S30/20( 可 折 秋 的 光伏 模块 ) 是 主要 技术 演化 
方向 ,分 别 占 比 约 12.47% 9.74% 和 6.73% 。 
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4 结语 


技术 演化 已 有 完整 的 研究 体系 ,但 从 专利 分 类 修 
订 角 度 开展 技术 演化 的 研究 则 较 少 ,本 文 从 这 个 角度 
开展 初步 探索 。 首先 从 专利 分 类 修订 出 发 ,根据 2009 
年 -2018 年 IPC 分 类 表 H 部 的 修订 总 结 出 4 种 分 类 
修订 类 型 :新 增 分 类 ,删除 分 类 .类 内 转移 分 类 、 类 间 转 
移 分 类 ,并 提出 分 类 修订 后 产生 过 档 文献 这 一 概念 。 
其 次 针对 过 档 文献 导致 新 旧版 专利 分 类 表 无 法 衔接 问 
题 提出 基于 Word2vec + TextCNN 模型 的 专利 再 分 类 方 
法 ,对 过 档 文献 再 分 类 ,从 而 通过 再 分 类 专利 联系 新 旧 
版 专利 分 类 表 。 最 后 结合 分 类 修订 前 后 技术 结构 变化 
和 对 再 分 类 专利 的 统计 分 析 ,描述 分 类 修订 中 主要 技 
演化 方向 。 本 文 不 仅 能 为 技术 演化 研究 提供 新 视 
< 书展 技术 演化 研究 体系 ,还 能 为 过 档 文献 的 再 分 类 
THELESS JEU A BRR. 
LO 本 文 研究 还 存在 以 下 不 足 :首先 未 能 对 H 部 技术 
沽 也 博 况 作出 全 景 描述 ,未 能 通过 可 视 化 手段 实现 “ 技 


图 


杭 党 化 全 景 图 ”展示 ,而 是 分 别 对 2009 年 -2018 年 修 


Word2vec + TextCNN 模型 准确 率 目前 仅 能 达到 80% 左 

在 再 分 类 准确 率 有 待 提高 ,这 对 本 研究 中 提供 技术 演 

信和 测报 的 准确 性 影响 巨大 。 最 后 未 能 提出 描述 技术 演 

化 万 计量 指标 ,只 采用 比例 形式 描述 技术 演化 重点 方 

ELA FRB a RHE I, ACA TB 

研究 。 
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N Abstract; | Purpose/ significance | This article attempts to study technological evolution from the perspective of 
@atent classification revisions, and provides new ideas for technological evolution research. | Method/ process | 
Gist , according to the 2009 — 2018 revisions of the H part of the IPC classification table, four types of revisions were 
hmmarized: new classification, deletion classification, intra-class transfer classification, and inter-class transfer 
ssification. Secondly, for the archived documents generated after classification revision, a reclassification method 
Gl patent archived documents based on the Word2vec + TextCNN model was proposed, so that the old and new classi- 
tion tables were connected by reclassifying patents. Finally, combined with the revised classification and reclassi- 
ication patents of Part H from 2009 to 2018, the preliminary exploration of technological evolution was carried out. 
«Result/conclusion | The patent reclassification model can effectively solve the problem of archived documents , pro- 
ides reference for patent reclassification work, and can link the new and old patent classification tables; based on 
(PC classification revision and reclassification of patents, the main technological evolution direction after classification 
"Gision can be analyzed, providing a new perspective for research on technological evolution. 
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